健康信息学正以前所未有的速度重塑现代医疗,它不再仅仅是电子病历的数字化,而是利用数据科学挖掘海量健康信息,以优化诊疗决策、提升公共卫生响应效率。这一领域架起了临床医学与计算技术之间的桥梁,让原本沉睡的数据转化为挽救生命的洞察。

在 Gist.Science,我们专注于从 medRxiv 预印本服务器中实时追踪该领域的最新研究。我们处理每一份新发布的论文,不仅提供详尽的技术解读,更将其核心发现转化为通俗易懂的中文摘要,确保无论是专业人士还是普通公众都能轻松理解这些前沿突破。

以下为您呈现健康信息学领域的最新论文列表,带您第一时间探索数据驱动医疗的未来。

Development of a natural language processing application to extract and categorize mentions of violence from mental healthcare records text

该研究开发并验证了一种基于多标签 BERT 的自然语言处理应用,能够从南伦敦大型精神健康服务的电子病历自由文本中高效提取并分类多种暴力形式(如情感、财务、非性身体暴力)及其相关特征(如施受者角色、发生情境等),从而显著提升了从常规精神健康记录中识别暴力事件的能力。

Li, L., Sondh, S., Sondh, H. K., Stewart, R., Roberts, A.2026-03-26📄 health informatics

A statistical framework for evaluating the repeatability and reproducibility of large language models

本文提出了一种受监管指导启发的统计框架,通过语义和内部两个维度量化大语言模型在生物医学任务中的重复性和可复现性,并发现提示策略显著影响其输出稳定性,且稳定性与诊断准确性并无必然关联。

Shyr, C., Ren, B., Hsu, C.-Y., Yan, C., Tinker, R. J., Cassini, T. A., Hamid, R., Wright, A., Bastarache, L., Peterson, J. F., Malin, B. A., Xu, H.2026-03-25📄 health informatics

Wearable-derived cardiovascular fitness age and its lifestyle correlates in 442 adults

该研究通过对 442 名佩戴 Ultrahuman Ring 的用户进行为期 12 个月的分析,证实了可穿戴设备衍生的心血管年龄不仅与睡眠质量和步数等独立生活方式指标显著相关,且能灵敏反映生理状态的改善,表明其可作为有效的健康风险沟通工具。

Shanmugam, A., Gupta, K., Dhawale, N., Singhal, V., Kumar, M., Srinivasan, B., Narasimhan, V.2026-03-25📄 health informatics

Human-supervised, large language model-based clinical decision support aligned to national newborn protocols in Kenya: a pragmatic, early-stage evaluation

这项研究在肯尼亚两家医疗机构对名为 AIFYA 的人类监督型大语言模型临床决策支持系统进行了早期评估,结果显示该系统能有效整合国家新生儿护理指南,在专家审核中展现出高准确性与引用可信度,并成功实现了在低资源环境下的落地应用。

Kuria, T., Kamau, G., Makokha, F., Omondi, P., Mbugua, G., David, K., Mbugua, S., Gitaka, J.2026-03-25📄 health informatics

The Power of Open Health Data: Impact, Representation, and Knowledge Diffusion

该研究通过引入两度引用分析方法,评估了四个主要开放健康数据仓库的学术影响力、研究社区构成及知识扩散情况,发现尽管各库资金规模差异巨大,其间接引用放大效应均稳定在约 10 倍,但不同数据源在低中收入国家参与度、性别代表性及高级作者地位方面存在显著差异,揭示了单纯的数据开放政策无法完全解决科研领域深层的结构性不平等。

Gorijavolu, R., Armengol de la Hoz, M. A., Bielick, C., Cajas, S., Charpignon, M.-L., El Mir, A., Gichoya, J. W., Kwak, H. G., Madapati, K., Mattie, H., McCullum, L., Mwavu, R., Nair, V., Nakayama, L. (…)2026-03-24📄 health informatics

Social Determinants of Health and Chronic Disease Risk Prediction in the All of Us Research Program

这项基于“全人类”研究计划近 26 万参与者数据的研究表明,将社会决定因素与人口统计学特征相结合能显著提升慢性病风险预测的准确性,且不同疾病类型(心理健康与心脏代谢疾病)受社会因素影响的路径存在显著差异,从而支持采用针对特定病情的社会因素筛查与干预策略以消除健康差距。

Kammer-Kerwick, M., Dave, Y., Parekh, V., McDonald, L., Watkins, S. C.2026-03-23📄 health informatics

Impact of a Social Media Derived Digital Self Management Platform on Population Level Irritable Bowel Syndrome Emergency Utilization: A Controlled Interrupted Time Series Analysis Using South Korean National Health Insurance Data

该研究利用韩国国家健康保险数据,通过受控中断时间序列分析证实,基于社交媒体患者讨论构建的“肠健康”数字自我管理平台显著降低了肠易激综合征相关的急诊就诊率和未计划住院率,尤其在年轻成人和腹泻型患者中效果更为明显。

Park, J.-H., Lim, A.2026-03-23📄 health informatics

Automated Extraction of Cancer Registry Data from Pathology Reports: Comparing LLM-Based and Ontology-Driven NLP Platforms

该研究通过对比基于大语言模型的 Brim Analytics 系统与基于本体的 DeepPhe 系统在胰腺癌和乳腺癌病理报告中的表现,证实了前者在多种注册变量提取上具有更高且更稳定的准确率,能够有效支持癌症登记数据的自动化处理流程。

McPhaul, T., Kreimeyer, K., Baris, A., Botsis, T.2026-03-23📄 health informatics